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大 数据 对 数字 出 版 的 应 用 价值 初探 


摘 要 : 大 数据 技术 出 现 后 ， 对 数字 出 版 产业 的 发 展 产 生 了 深远 的 影响 。 无 论 在 内 容 生 产 、 流 程 管理 、 传 播 方式 ， 还 是 交付 
形态 等 诸多 方面 ， 都 表现 出 不 同 以 往 的 特征 ， 即 生产 主体 多 元 化 、 流 程 管理 协同 化 、 传 播 方式 场景 化 、 交 付 形 态 多 样 化 。 数 
字 出 版 逐渐 摆脱 传统 出 版 的 局 限 ， 向 图 书 、 期 刊 、 报 纸 、 广 播 电 视 以 及 互联 网 出 版 等 多 种 业态 融合 的 趋势 发 展 。 本 文 基 于 这 
一 时 代 背 景 ， 从 用 户 画 像 、 产 品 发 据 与 过 滤 、 出 版 流程 协同 、 供 需 链 结构 变化 以 及 知识 服务 的 深化 等 方面 益 述 了 大 数据 对 数 
字 出 版 的 应 用 价值 ， 认 为 通过 大 数据 精准 定位 ， 实 现 用 户 体验 的 优化 与 迭代 ; 构建 知识 关联 体系 ， 实 现 内 容 的 发 握 与 过 滤 ; 
整合 企业 内 外 资源 ， 推 动产 品 的 协同 运营 ; 优化 供需 链 结 构 ， 控 制 经 营 风险 ; 加 强 资源 深度 开发 ， 实 现 知识 服务 的 更 新 迭代 。 
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随 着 大 数据 的 发 展 逐 步 迈 入 实质 应 用 阶段 ， 对 社会 
各 个 层面 都 产生 了 重大 的 影响 : 行业 层面 上 ， 决 策 依据 
更 加 全 面 和 准确 ， 有 助 于 形成 新 的 核心 竞争 力 ， 对 企业 
的 生产 模式 、 商 业 模 式 以 及 管理 模式 等 都 产生 了 深刻 的 
变革 ,行业 之 间 的 界限 模糊 化 ; 思维 方式 层面 上 ， 从 满 
足 于 样本 数据 变 为 使 用 全 体 数 据 ， 从 追求 精确 性 到 容忍 
混杂 性 ， 从 关注 因果 关系 到 关注 相关 关系 ; 智慧 和 战略 
层面 上 , 数据 的 膨胀 在 “ 量 ” 上 引发 混沌 的 同时 , 在 “ 质 ” 
上 可 能 开始 显现 出 秩序 ， 对 社会 发 展 和 管理 模式 提出 了 
新 的 挑战 。0 

在 这 个 时 代 背 景 下 ， 数 字 出 版 的 发 展 逐 步 走向 多 元 
化 : 网 络 出 版 、 移 动 出 版 、 数 据 库 出 版 、 融 合 出 版 以 及 
知识 服务 等 。 数 字 出 版 本 身 的 特征 也 发 生 重大 变化 ， 从 
内 容 生 产 、 管 理 过 程 、 产 品 形态 以 及 传播 渠道 的 单纯 的 
数字 化 ' 发 展 为 内 容 生 产 主 体 的 多 元 化 、 交 付 方 式 的 多 样 
化 、 服 务 过 程 的 系统 化 以 及 内 容 推 荐 的 智能 化 。 内 容 生 
产 主体 的 多 元 化 体现 为 UGC ( 用 户 生 产 内 容 ) 、PGC ( 专 
业 生 产 内 容 ) 、0GC (职业 生产 内 容 ) 以 及 DGC (设备 
驱动 内 容 ) 等 多 种 内 容 生产 模式 的 涌现 ; 交付 方式 的 多 
样 化 如 纸 质 图 书 、 音 频 图 书 、VR/AR 图 书 、 知 识 付费 乃 
至 知识 服务 等 ;服务 过 程 的 系统 化 体现 在 多 层次 的 关联 
体系 为 读者 提供 完整 的 知识 体系 ; 内 容 推 荐 的 智能 化 体 
现在 用 户 画像 基础 上 的 精准 推荐 。 

在 数字 出 版 上 述 特征 的 形成 与 演变 过 程 中 ， 大 数据 
技术 的 应 用 是 最 主要 的 推动 因素 。 随 着 数字 出 版 产业 的 
发 展 ， 大 数据 的 应 用 价值 越 来 越 大 。 
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1. 大 数据 对 数字 出 版 的 重要 价值 
1.1 用 户 画像 的 构建 与 迭代 

用 户 画 像 ( persona ) 是 美国 交互 设计 师 阿 兰 ' 库 珀 
在 《交互 设计 之 路 一 让 高 科技 产品 回归 人 性 》 一 书 中 提 
出 的 概念 ，persona 本 意 为 面具 ， 引 申 义 为 “面具 ”所 表 
现 出 来 的 “角色 ”， 主 要 作用 在 于 描述 用 户 特 征 。 根 据 
用 户 的 现实 特征 和 潜在 特征 ， 用 户 画 像 可 以 分 为 静态 画 
和 象 和 动态 画像 两 种 。 前 者 主要 针对 用 户 的 统计 学 特征 ( 如 
出 生日 期 、 性 别 、 学 历 以 及 职业 等 ) 和 行为 特征 ( 如 家 
食 住 行 、 娱 乐 、 社 交 以 及 学 习 等 消费 习惯 ) ; 后 者 则 针 
对 用 户 的 可 能 性 、 潜 在 性 和 趋势 性 特征 。 中 前 者 以 用 户 
需求 为 导向 ， 重点 在 于 应 用 场景 中 的 用 户 行为 模式 ， 后 
者 以 生活 愿景 为 导向 的 用 户 生活 方式 的 描述 ， 重 点 在 于 
数据 挖 握 基 础 上 的 用 户 趋势 预测 。 站 

大 数据 视角 下 的 用 户 概 念 ， 外 延 扩 展 到 所 有 
既 包括 现实 或 者 潜在 用 户 ， 也 包括 跨行 业 潜在 用 户 。 界 
定 用 户 的 标准 在 于 其 价值 提供 和 价值 共 创 的 结果 ， 而 非 
是 否 购买 企业 的 产品 / 服务 或 者 参与 过 企业 活动 。" 大 数 
据 基础 上 的 用 户 画 像 通过 用 户 标 签 化 ， 构 建 数据 模型 研 
究 “ 全 样本 ”用 户 特征 , 有 助 于 准确 识别 和 描绘 目标 用 户 ， 
有 效 联接 用 户 的 属性 、 行 为 与 期 待 ， 极 大 地 避免 了 主观 
因素 的 干扰 ; 有 助 于 及 时 掌握 用 户 的 异动 ， 促 进 产品 / 服 
务 的 升级 或 者 调整 ， 有 助 于 针对 用 户 的 个 性 化 需求 实现 
精准 推荐 。™ 

与 其 他 行业 比较 , 数字 出 版 的 用 户 的 特点 更 加 复杂 ， 
首先 是 用 户 角 色 的 多 重 性 。 同 一 个 用 户 既 可 能 单一 的 服 
务 使 用 角色 ， 也 可 能 是 集 内 容 的 创作 者 、 使 用 者 、 演 绎 
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者 以 及 传播 者 中 某 几 个 或 者 全 部 于 一 体 的 混合 角色 。 其 
次 是 用 户 之 间 的 关联 性 。 基 于 对 共同 主题 内 容 的 关注 和 
用 户 自 丑 知识 层次 产生 用 户 之 间 的 碰撞 效应 或 者 同化 效 
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源 或 者 个 体 ， 协 同一 致 地 完成 某 一 目标 的 过 程 或 能 力 。 
站 在 具有 独立 法 人 地 位 企业 的 角度 ， 协 同 包括 企业 之 间 
的 协同 和 企业 内 部 的 协同 。 企 业 之 间 的 协同 包括 纵向 协 


应 ， 形 成 用 户 之 间 多 种 多 样 的 关联 关系 。 最 后 是 用 户 特 
征 的 动态 演变 。 随 着 用 户 知 识 量 的 增加 ， 对 内 容 的 需求 、 
内 容 产 业 链 上 扮演 的 角色 以 及 社交 关系 等 都 处 于 持续 的 
动态 演变 过 程 中 。 数 字 出 版 的 目标 用 户 的 这 些 特点 不 仅 
要 求 准 确 描述 用 户 的 现实 特征 ， 进 行 静态 画像 ， 以 便 实 
现 产品 /服务 的 精准 推送 ， 更 要 着 眼 未 来 ， 准 确 把 握 用 户 
需求 的 发 展 趋势 ， 进 行动 态 画 像 ， 以 便 捕捉 用 户 兴 趣 与 
需求 的 变化 ， 实 现 用 户 画像 的 完整 构建 与 不 断 迭 代 。 

1. 2 长 尾 产 品 的 发 掘 与 过 滤 

2004 年 10 月 ，《 连 线 》 杂 志 主 编 克 里 斯 . 安德森 
提出 长 尾 理 论 ， 他 认为 ，“ 只 要 存储 和 流通 的 渠道 足够 
大 , 需求 不 旺 或 销量 不 佳 的 产品 所 共同 占据 的 市 场 份额 ， 
可 以 和 那些 少数 热 销 产 品 所 占据 的 市 场 份额 想 匹 敌 甚至 
更 大 ， 即 众多 小 市 场 可 汇聚 成 与 主流 大 市 场 相 匹 敌 的 市 
场 能 量 ”。 长 尾 效应 的 意义 在 于 “将 所 有 非 流行 的 市 场 
累加 起 来 会 形成 一 个 比 流行 市 场 还 大 的 市 场 ”"。 

大 数据 时 代 的 到 来 ， 人 们 获取 的 信息 量 越 来 越 大 ， 
长 期 存在 的 信息 不 对 称 现象 因此 得 到 改善 。 与 此 同时 ， 
大 数据 也 引发 了 选择 困境 ， 面 对 海量 的 信息 人 们 无 所 适 
从 ， 尤 其 对 大 量 价值 有 限 甚或 垃圾 信息 难以 甄别 ， 从 而 
形成 了 大 数据 实践 应 用 中 的 悖 论 。 反 映 在 市 场 经 济 中 体 
现 为 容 律 分 布 趾 与 长 尾 分 布 的 并 存 ， 一 方面 ， 由 于 关注 
度 的 集聚 效应 ， 头 部 产品 所 占 比例 越 来 越 小 ， 单 品 销量 
越 来 越 大 ; 另 一 方面 , 长 尾 产品 越 来 越 多 , 质量 参差 不 齐 ， 


同 与 横向 协同 ， 前 者 最 典型 的 例子 就 是 外 包 ， 后 者 即 联 
合 开发 ， 双 方 或 者 多 方 组 成 项 目 组 共同 开发 ， 获 取 的 知 
识 产 权 和 利润 按 比 例 分 扒 。 企业 间 协同 根据 紧密 程度 分 
为 三 个 层次 ， 即 低 耦 合 、 中 耦合 和 高 耦合 。 企 业内 部 的 
协同 也 分 为 三 个 层次 ， 即 产品 结构 的 协同 、 专 业 技术 的 
协同 和 内 部 各 业务 部 门 之 间 的 协同 。™ 

大 数据 背景 下 的 企业 协同 ， 更 注重 资源 整合 意义 上 
的 协同 。 从 内 部 而 言 ， 必 须 打破 系统 边界 ， 打 破 部 门 壁 
人 垒 ， 整 合 企业 内 外 多 源 异 构 的 数据 ， 通 过 大 数据 分 析 ， 
掌握 企业 自身 优势 与 劣势 、 市 场 环 境 、 用 户 特征 与 需求 ， 
改革 并 优化 企业 内 部 的 管理 与 服务 流程 ， 为 用 户 提供 精 
准 的 产品 /服务 。 从 外 部 而 言 ， 企 业 不 同 阶段 的 发 展 需求 
必然 不 断 产生 各 种 或 虚 或 实 的 团队 ， 导 致 协同 的 边界 不 
断 扩大 ， 相 应 的 资源 需求 不 断 扩大 而 且 多 变 。 通 过 大 数 
据 分 析 ， 有 效 整 合 包括 人 力 、 组 织 、 技 术 以 及 资金 等 在 
内 的 各 种 企业 外 部 资源 , 并 随时 根据 实际 状况 动态 调整 ， 
实现 企业 内 部 之 间 以 及 企业 之 间 信 息 的 共享 和 利用 ， 优 
化 外 部 合作 流程 ， 从 而 大 幅 提升 效率 。'” 

相 比 其 他 行业 , 数字 出 版 流程 涉及 的 因素 更 为 复杂 ， 
用 户 画 像 描述 、 选 题 策划 、 表 达 方 式 确定 、 交 付 方式 选择 、 
外 部 审 校 资 源 与 作者 资源 整合 、 关 联 体 系 构建 、 交 互 功 
能 设计 与 内 容 监管 以 及 版 权 追 踪 监 控 等 ， 都 必须 整合 企 
业内 部 与 外 部 的 各 种 资源 ， 针 对 不 同 需求 进行 相应 的 甄 
别 与 选择 ， 尤 其 是 面 对 快 速 多 变 的 内 容 创作 创新 ， 更 加 


= 


人 们 的 选择 与 甄别 越发 困难 。 这 一 问题 的 解决 依然 要 回 
到 大 数据 本 身 ， 通 过 完整 的 用 户 画 像 与 产品 特征 的 描述 
实现 产品 的 精准 推荐 。 
图 书 出 版 业 属 于 小 众 行 业 ， 一 方面 ， 大 多 数 图 书 的 
读者 群 有 限 ， 不 可 能 有 巨大 的 销量 ; 另 一 方面 ， 如 此 众 
多 的 图 书 充斥 市 场 ， 结 果 是 大 多 数 图 书 很 难 找 到 目标 读 
者 ， 只 有 极 少数 的 图 书 最 终 成 为 畅销 书 。 包 进入 数字 出 
版 阶段 之 后 ， 这 一 特征 体现 的 更 加 明显 ， 存 储 和 复制 的 
边际 成 本 趋 近 于 零 ， 创 作 门 槛 大 幅 降 低 ， 所 出 版 的 作品 
规模 急剧 扩张 。 震 律 分 布 与 长 尾 分 布 的 两 极 化 现象 在 数 
字 出 版 业内 更 加 剧烈 , 长 尾 产 品 的 挖掘 与 过 滤 更 加 困难 。 
通过 大 数据 技术 ， 有 助 于 建立 完整 的 用 户 画 像 ， 以 识别 
用 户 需 求 ， 建 立 完整 的 知识 关联 体系 ， 以 导航 定位 发 气 
优质 的 长 尾 产 品 ， 通 过 用 户 评 价 以 及 作品 相关 的 各 种 被 
引用 关系 等 实现 劣质 长 尾 产 品 的 过 滤 。 
1.3 出 版 流程 的 协同 

所 谓 协 同 ， 就 是 指 协调 两 个 或 者 两 个 以 上 的 不 同 资 


要 求 协同 的 出 版 流程 ， 实 现 产 品 /服务 市 场 的 高 效 运营 。 
大 数据 技术 的 运用 ， 有 助 于 提升 出 版 流程 各 个 环节 的 市 
场 化 程度 ， 据 此 实现 内 部 部 门 之 间 的 分 工 协调 ， 外 部 资 
源 的 充分 利用 , 进而 提升 数字 出 版 企业 的 协同 管理 效率 。 
1. 4 供需 链 结构 的 优化 

供需 链 的 研究 起 源 于 20 世纪 60 年 代 ， 一 般 是 指 由 
进行 物料 获取 、 加 工 物料 成 中 间 件 或 者 成 品 ， 再 将 成 品 
送 到 用 户 手中 的 一 些 企 业 或 者 企业 部 门 构成 的 网 络 。 参 
与 供需 链 的 主体 包括 供应 商 、 生 产 商 、 配 送 中 心 、 零 售 
商 以 及 最 终 用 户 。 供 需 链 涉及 的 内 容 包括 参与 供需 链 的 
有 关 实 体 之 间 的 物流 、 信 息 流 与 资金 流 。" 根据 供需 链 
:起 核心 作用 的 企业 类 型 ， 供 需 链 模式 可 以 分 为 以 分 销 
商 为 核心 的 供需 链 、 以 制造 商 为 核心 的 供需 链 、 以 拍卖 
商 为 核心 的 供需 链 三 种 。"” 有 效 的 供需 链 管理 有 助 于 企 
业 降 低 成 本 ， 提 高 竞争 力 ; 加 速 整 个 供需 链 上 物流 与 信 
息 流 的 流动 ， 缩 短 产 品 流通 周期 ; 突出 企业 核心 能 
加 强 竞 争 力 。 
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大 数据 技术 的 出 现 , 通过 对 供需 信息 的 量化 与 分 析 ， 通过 外 化 实现 隐 性 知识 到 显 性 知识 的 转化 ; 通过 整合 实 
降低 供需 链 中 的 不 确定 风险 , 改变 了 传统 的 供需 链 模 式 ， 现 显 性 知识 之 间 的 转化 ; 通过 内 化 实现 显 性 知识 到 隐 性 
体现 在 两 方面 : 一 是 供需 从 面对面 模式 ( 即 传统 的 批量 《知识 的 转化 。'… 通过 显 性 知识 与 隐 性 知识 相互 之 间 不 
模式 ) 到 点 对 点 〈 即 根据 消费 需求 定点 生产 与 销售 ) 模 ” 断 的 转化 ， 实 现 知识 本 身 的 创新 与 传播 。 

式 的 确立 ; 二 是 供需 分 析 预 测 的 广度 、 深 度 和 准确 度 的 大 数据 的 出 现 使 知识 服务 在 知识 生产 与 更 新 、 典 型 
提高 。 第 一 个 体现 对 于 生产 者 而 言 意味 着 生产 端 与 消费 特征、 服务 范围 与 模式 等 方面 都 产生 了 过 异 于 以 往 的 变 
端 沟 通 距 离 的 缩短 ， 上 文中 的 三 种 供需 链 模式 因 之 分 化 化。 首先， 知识 生产 主体 多 元 化 ， 既 有 领域 内 专家 ， 也 
解体 , 个 性 化 需求 的 满足 逐步 成 为 企业 生产 的 主流 模式 ; 有 普通 用 户 ， 既 有 职业 机 构 ， 也 有 个 体 生 产 ， 出 现 既 有 
对 于 消费 者 而 言 意味 着 按 需 购买 模式 的 盛行 ,用户 根据 系统 化 的 专业 知识 ， 也 有 碎片 化 的 应 用 /普及 知识 ， 从 而 
商家 基于 大 数据 分 析 的 推荐 和 自身 实际 需求 选择 合适 的 ”增强 了 知识 关联 体系 构建 的 必要 性 。 其 次 ， 在 知识 更 新 
产品 /服务 。 第 二 个 体现 传统 的 样本 分 析 、 概 貌 分 析 演 变 ”的 方式 上 ， 既 有 质变 性 的 系统 化 更 新 ， 也 有 知识 交互 过 
为 精准 分 析 ， 并 以 此 为 基础 对 未 来 趋势 进行 预测 ， 根 据 程 中 产生 的 量变 性 质 的 碎片 化 更 新 ， 知 识 交 互 同 时 具有 
趋势 预测 确定 企业 的 战略 决策 。™™” 了 用 户 体验 与 知识 输出 的 功能 。 再 次 ， 知 识 服务 的 典型 
数字 出 版 与 包括 传统 出 版 在 内 的 行业 供需 链 相 比 ， 特征 体现 在 : 面向 自主 需求 和 智慧 服务 、 不 确定 性 、 强 


5S 构成 和 运作 模式 都 有 很 大 不 同 。 供 需 链 的 构成 上 有 内 容 。 调用 户 参 与 、 按 需 使 用 与 付费 以 及 基于 群体 创新 等 。™ 
| 供需 链 、 技 术 供 需 链 以 及 载体 供需 链 ， 其 中 ， 内 容 供需 从 社会 功能 角度 看 ， 个 人 认为 ， 数 字 出 版 与 图 书 出 
加 链 从 作者 到 出 版 单位 到 平台 商 ( 包括 出 版 单位 自 建 平台 版 并 无 二 致 ， 那 就 是 娱乐 和 教化 。 前 者 如 网 络 文学 、 网 
= 到 用 户 端 ; 技术 供需 链 从 数据 加 工商 〈 例 如 内 容 的 数字 络 游 戏 、 数 字音 乐 以 及 网 络 动漫 等 ; 后 者 如 电子 图 书 、 
ey 化 加 工 或 者 音 视 频 加 工 ) 到 出 版 单位 再 到 技术 开发 商 ( 平 ”数字 报纸 、 数 字 期 刊 、 网 络 教育 出 版 物 、 数 据 库 出 版 物 
OO 台 或 者 数据 库 开发 ) ; 载体 供需 链 从 作者 到 出 版 单位 到 以 及 手机 出 版 物 等 。 从 上 文 对 大 数据 背景 下 数字 出 版 和 
co 渠道 商 再 到 零售 商 最 后 到 读者 。 无 论 每 一 条 供需 链 除 了 ”知识 服务 的 分 析 可 以 看 出 , 知识 服务 更 强调 用 户 为 中 心 ， 
CN 中 介 性 质 的 出 版 单位 之 外 ， 都 不 是 一 般 行业 的 一 对 一 和 ” ”根据 用 户 的 信息 偏好 以 及 具体 需要 ,采取 个 性 化 的 服务 
已 一 对 多 ， 而 是 多 对 多 ， 而 且 供需 链 上 的 角色 之 间 还 存在 。 方式 ,为 用 户 提供 针对 实际 问题 的 解决 方案 等 ， 因 此 ， 
四 重合 性 或 者 协作 关系 ， 前 者 如 作者 与 读者 角色 的 重合 ， 可 以 把 知识 服务 视 为 教化 领域 数字 出 版 的 深化 。™ 依托 
i 后 者 如 数据 加 工商 与 平台 开发 商 之 间 的 协作 。 大 数据 的 。 大 数据 技术 ， 知 识 服 务 既 可 以 整合 已 有 的 存量 系统 化 知 
应 用 ,使 整个 供需 链 的 上 下 游 都 发 生 改变 ， 从 相对 单一 识 资源 ， 又 可 以 整合 社会 上 的 相关 碎片 化 知识 资源 ， 还 
[四 的 线性 结构 变 为 多 元 立体 的 网 状 结构 "”。 通 过 对 最 终 用 ”可 以 通过 知识 交互 产生 新 的 知识 。 在 此 基础 上 ， 构 建 完 
一 户 画 像 的 描述 ， 供 需 链 上 各 个 角色 的 分 析 ， 实 现 出 版 不 ” 整 的 知识 关联 体系 ， 实 现 系统 知识 和 碎片 知识 的 关联 ， 
© 同 角色 供需 的 精准 匹配 ， 优 化 供需 链 结 构 。 自动 建立 新 知识 与 已 有 知识 的 关联 , 消除 "信息 超载 ”“ 知 

1. 5 知识 服务 的 深层 次 发 展 识 碎片 化 ”和 “信息 孤岛 ”等 问题 ， 促 进 知识 服务 的 深 


知识 服务 ， 指 以 知识 资源 为 对 象 ， 以 信息 知识 的 组 ” 层次 发 展 。™ 


织 、 关 联 、 挖 扎 、 重 构 等 为 手段 ， 为 用 户 提供 个 性 化 的 。 2. 借 力 大 数据 ， 实 现 出 版 的 转型 发 展 
智能 服务 。 它 是 当今 知识 信息 资源 共享 模式 设计 的 核心 。 2.1 基于 功能 定位 ， 实 现 用 户 体验 的 优化 与 迭代 


能 多 

指导 思想 ， 这 种 共享 模式 为 用 户 提供 的 是 针对 特定 问题 所 谓 用 户 体验 ,简单 讲 就 是 用 户 的 主观 感受 ， 主 要 
的 解决 方案 ， 即 “知识 ”。m 知识 包括 显 性 知识 和 隐  ” 指 用 户 使 用 产品 之 前 、 期 间 和 之 后 的 认 知 印象 和 回应 。 
性 知识 。 其 中 ， 显 性 知识 指 容易 转化 为 符号 的 知识 , 可 ”中 影响 用 户 体验 的 因素 主要 有 四 个 ， 即 产品 策略 、 用 户 
以 语言 表述 从 而 传播 ; 隐 性 知识 隐藏 在 知识 主体 手中 和 界面、 技术 以 及 运营 等 .大 数据 通过 量化 用 户 的 愉悦 度 、 
头脑 中 ， 体 现 为 技能 、 诀 穿 、 洞 察 力 、 经 验 等 无 法 用 语 ”参与 度 、 接 受 度 、 留 存 度 与 任务 完成 度 等 指标 ， 建 立 完 
言 或 者 特定 符号 编码 的 知识 。"" 前 者 最 典型 的 呈现 方 。” 整 的 用 户 静 态 与 动态 画像 ， 改 善 影响 用 户 体验 的 因素 ， 
式 就 是 出 版 物 ， 尤 其 是 图 书 ， 系 统 的 论证 与 前 述 、 便 捷 ”实现 用 户 体验 的 优化 与 迭代 。 

的 传播 与 交付 ， 成 为 显 性 知识 最 佳 的 载体 选择 ; 后 者 最 大 数据 在 用 户 体验 上 的 功能 诉求 可 以 分 为 三 个 ， 即 
常见 的 表现 例如 师 徒 传承 、 实 践 练习 以 及 头脑 风暴 等 ， 基于 销售 的 智能 推荐 、 基 于 选 题 的 需求 分 析 和 基于 创作 
“只 可 意 会 ， 不 可 言传 ”是 其 最 主要 的 特征 。 两 者 同时 ”的 能 力 分 析 。 所 以 ， 用 户 体验 的 优化 与 迭代 应 从 这 三 个 
又 可 以 相互 转化 ,通过 社会 化 实现 隐 性 知识 之 间 的 转化 。 方面 展开 。 
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首先 ， 应 对 海量 的 用 户 数 据 进行 最 大 限度 的 采集 与 
整理 ,分 析 其 静态 特征 ， 包 括 统计 学 特征 和 行为 特征 ， 
从 而 找到 产品 的 潜在 用 户 ， 进 而 提供 精准 推荐 服务 ， 进 
行 场景 化 的 介绍 , 简化 用 户 选择 过 程 , 提高 用 户 购买 体验 。 
其 次 ， 加 强 非 结构 化 数据 的 采集 整理 ， 尤 其 是 潜在 
细 分 领域 中 用 户 共同 关注 的 话题 、 发 表 的 言论 、 表 达 的 
思想 等 等 ， 通 过 挖掘 与 分 析 ， 发 现 用 户 数据 背后 所 反映 
的 深层 思想 和 预见 趋势 ， 进 而 策划 细 分 市 场 选 题 ， 并 且 
在 选 题 策划 过 程 中 持续 追踪 这 些 变 化 ， 不 断 迭 代 ， 最 终 
形成 符合 用 户 需 求 的 选 题 与 产品 。 

最 后 ， 通 过 隐 性 知识 标 引 与 隐 性 知识 地 图 构建 ， 寻 
找 符合 需求 的 潜在 作者 ， 并 对 作者 的 专业 能 力 与 创作 能 
力 进行 分 析 。 隐 性 知识 标 引 通过 隐 性 知识 显 性 化 的 方式 
进行 : 其 一 是 个 人 主动 提供 ,包括 个 人 详细 信息 、 经 历 、 
创作 的 作品 以 及 交互 过 程 中 的 内 容 输 出 等 ， 从 中 选取 标 
识 个 人 的 标签 ; 其 二 是 他 人 评价 ， 主 要 是 在 各 种 交互 过 
程 中 周围 人 士 对 所 输出 的 内 容 的 各 种 评论 、 解 读 以 及 态 
度 等 ， 从 外 部 视角 做 出 更 客观 的 评价 。 最 后 是 系统 自动 
发 现 ， 及 时 捕捉 个 人 的 隐 和 性 知识 ,例如 人 与 人 的 互动 过 
程 中 不 自觉 显示 的 某 些 技能 等 。” 隐 性 知识 地 图 的 构建 
主要 通过 分 析 与 作者 相关 的 数据 之 间 的 关联 关系 ,包括 
作者 与 作品 关系 、 领 域内 作者 之 间 关 系 以 及 领域 内 作品 
之 间 关 系 等 。 根 据 作 者 的 专业 能 力 、 创 作 能 力 与 沟通 能 
力 确 定 作品 的 创作 方式 、 表 达 方 式 以 及 传播 协作 等 。 
2. 2 构建 关联 体系 ， 实 现 内 容 的 发 掘 与 过 滤 

大 数据 的 价值 由 大 数据 的 关联 性 即 大 数据 结构 表 
达 。 汪 大 数据 伴生 的 信息 超载 和 信息 孤岛 现象 与 数字 出 
版 的 需 律 分 布 和 长 尾 分 布 并 存 现象 导致 除 少 数 头 部 内 容 
外 ,大 多 数 内 容 无 法 得 到 足够 的 展示 机 会 为 用 户 所 知晓 ， 
部 分 劣质 内 容 也 无 法 及 时 处 理 ， 信 噪 比 降低 。 解 决 这 个 
问题 ， 就 必须 回归 大 数据 的 价值 根本 ， 那 就 是 通过 关联 
体系 的 构建 , 充分 运用 知识 之 间 存 在 的 多 类 型 、 多 维度 、 
多 层次 的 关联 关系 ， 实 现 知 识 的 挖掘 、 发 现 、 验 证 、 甄 
别 以 及 过 滤 等 。™ 

运用 大 数据 技术 构建 知识 关联 ， 实 现 优质 内 容 的 发 
现 与 劣质 内 容 的 过 滤 ， 可 以 从 几 个 方面 展开 : 
首先 ， 通 过 基于 大 数据 的 自动 标 引 、 社 会 标 引 以 及 
知识 元 标 引 等 构建 显 性 知识 、 知 识 内 容 以 及 学 科 知 识 
类 型 的 已 有 知识 关联 ， 在 此 基础 上 ， 结 合 知识 交互 过 程 
中 的 输出 , 不断 将 新 产生 知识 纳入 既 有 知识 体系 的 同时 ， 
完善 知识 ( 包括 交互 过 程 中 的 输出 知识 ,下 同 ) 的 评价 
间 标 体系 ， 进 而 建立 隐 性 知识 关联 与 个 性 化 的 主题 知识 
关联 ， 通 过 知识 之 间 的 相互 印证 和 用 户 评价 两 个 角度 达 
到 知识 发 现 与 过 小 的 目的 。 
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其 次 ， 从 知识 与 知识 之 间 、 知 识 与 人 之 间 以 及 人 与 
人 之 间 等 三 个 维度 完善 关联 关系 ， 知 识 与 知识 之 间 的 关 
联 即 上 文 显 性 知识 之 间 的 关联 ; 知识 与 人 之 间 的 关联 意 
味 着 必须 对 人 即 读者 和 作者 进行 标 引 ， 这 种 标 引 既 包 括 
统计 学 意义 上 的 特征 标 引 ， 也 包括 行为 意义 上 的 特征 标 
引 ， 在 此 基础 上 ， 通 过 知识 与 作者 之 间 的 多 样 化 关联 ， 
确定 知识 内 容 的 真 伪 。 知 识 内 容 真 伪 的 辨识 通过 两 个 途 
径 实 现 : 其 一 是 类 似 文献 分 析 中 的 共 引 和 耦合 分 析 ， 发 
现 指定 知识 内 容 的 关联 关系 ， 从 而 做 出 正确 判断 ;其 二 
是 用 户 评价 ， 通 过 多 数 人 的 看 法 得 出 正确 结论 。 

最 后 是 综合 运用 简单 关联 、 时 序 关 联 和 因果 关联 等 
规则 ， 及 时 发 现 异常 数据 ， 清 除 垃圾 账号 与 垃圾 信息 ， 
减少 噪声 。 通 过 简单 关联 规则 中 两 类 变量 ( 例如 交互 过 
程 中 输出 内 容 与 原始 内 容 ) 之 间 相 关 程 度 的 测算 ， 判 断 
输出 内 容 质量 的 优 劣 与 输出 动机 ; 通过 行为 发 生 的 时 间 
对 行为 ( 例如 内 容 输出 的 行为 与 时 间 ) 进 行 时 序 关联 计算 ， 
判断 输出 者 的 勤勉 程度 或 者 输出 内 容 的 性 质 ; 通过 关联 
的 时 序 、 强 度 、 特 异性 、 可 重复 性 、 一 致 性 、 合 理性 以 
及 相似 性 等 标准 ， 确 定 因 果 关 联 成 立 的 可 能 性 ， 从 而 发 
现 新 知识 、 判 断 现 有 知识 的 正确 与 否 。™" 
2. 3 整合 企业 内 外 资源 ， 推 动产 品 协同 运营 

大 数据 对 数字 出 版 流程 优化 的 作用 主要 通过 数据 分 
析 与 挖掘 实现 决策 支持 ， 为 产品 生命 周期 不 同 阶段 的 内 
外 资源 整合 提供 识别 与 选择 、 汲 取 与 配置 、 激 活 和 有 机 
融合 ， 构 建 企业 价值 链 ， 中 促进 开发 过 程 中 各 个 环节 的 
有 效 衔接 与 资源 利用 率 的 最 大 化 ， 及 时 发 现 并 处 理 运营 

时 中 的 隐患 ， 加 快 产品 的 更 新 迭代 ， 实 现 产 品 的 协同 


过 程 
运 


通过 大 数据 技术 整合 资源 ， 推 动产 品 协同 运营 应 从 
以 下 几 个 方面 展开 : 

首先 ， 在 选 题 策划 阶段 应 从 内 容 和 主创 作者 两 个 角 
度 考虑 。 内 容 方面 ， 通 过 大 数据 对 现 有 海量 文献 数据 分 
析 与 挖掘 ， 根 据 关注 度 、 词 频 统 计 、 共 引 度 以 及 耦合 度 
等 多 种 指标 ， 及 时 发 现 学 科研 究 热点 方向 、 学 科 细 分 市 
场 盲 点 ( 例如 研究 或 者 科普 ) 、 不 同 层 次 读者 关注 的 重 
点 等 确定 选 题 方向 ( 即 所 请 思想 ) ， 然 后 ， 通 过 用 户 面 
像 分 析 用 户 的 应 用 场景 ， 据 此 确定 不 同 应 用 场景 的 表达 
方式 。 主 创作 者 方面 ， 在 通过 现 有 海量 文献 数据 分 析 与 
挖掘 的 同时 ,建立 作者 数据 库 ， 对 作者 的 专业 研究 方向 、 
学 术 关 注 度 、 媒 体 关注 度 、 学 术 传播 度 、 用 户 关 注 度 、 
创作 风格 、 粉 丝 群体 以 及 动态 行为 等 跟踪 分 析 ， 根 据 作 
品 应 用 场景 精准 选 定 作者 。 基 于 版 权 引进 的 选 题 分 析 则 
在 此 基础 上 增加 版 权 作 品 输出 区 的 市 场 分 析 、 作 者 与 作 
品 在 输入 区 的 影响 力 与 前 景 分 析 等 。 
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其 次 ， 在 内 容 生 产 阶段 主要 考虑 两 个 方面 : 一 是 场 
景 化 的 表达 与 迭代 ; 二 是 内 容 关 联 的 及 时 建立 与 更 新 。 
前 者 根据 用 户 的 应 用 场景 细 分 化 ， 并 对 不 同 场景 的 相关 
数据 资源 予以 整合 ， 实 现 内 容 的 一 次 创作 ， 多 次 发 布 。 
在 此 基础 上 ， 确 定 与 应 用 场景 相 匹配 的 表达 方式 和 交付 
方式 ， 例 如 沉浸 式 深度 或 者 浅 度 阅 读 、 陪 伴 式 阅 读 ( 亲 
子 阅 读 可 归 入 此 类 ) 、 伴 随 式 阅读 ( 音频 读物 ) ， 可 分 
别 采用 专业 论述 或 者 普及 讲述 ， 音 频 或 者 文字 等 。 在 创 
作 过 程 中 ,不 断根 据 用 户 反 馈 协 助 作 者 调整 创作 思路 ， 
完善 交付 设计 ， 实 现 产 品 的 更 新 迭代 。 后 者 则 在 内 容 发 
布 更 新 的 同时 ,不断 建立 完善 内 容 关 联 ， 实 现 交 付 的 增 
值 与 迭代 ， 方 式 如 上 文 所 述 。 

最 后 ， 在 产品 传播 阶段 ， 通 过 大 数据 技术 着 重 解决 
产品 与 应 用 场景 的 连接 问题 ， 提 高 产品 交付 效率 。 这 个 
连接 主要 通过 两 条 途径 实现 : 一 是 通过 大 数据 分 析 找 到 
目标 用 户 及 其 使 用 场景 ,通过 用 户 画 像 实现 产品 的 智能 
化 精准 推荐 ; 二 是 通过 针对 性 的 诱因 设计 ， 刺 激 用 户 的 
主动 传播 行为 ， 实 现 产 品 的 裂变 传播 。 其 中 ， 智 能 化 推 
荐 通过 两 种 方式 实现 ， 一 种 是 整合 用 户 与 应 用 场景 连接 
渠道 基础 上 的 主动 推荐 ,例如 智能 音箱 最 适合 伴随 式 阅 
读 场景 ， 因 此 ， 通 过 智能 音箱 的 实物 分 发 渠道 向 用 户 推 
荐 适合 伴随 场景 的 有 声 读物 ; 另 一 种 是 基于 关联 (此 处 
关联 指 普遍 意 义 上 的 关联 ， 不 包括 知识 关联 ) 规则 挖掘 
的 关联 推荐 ， 通 过 分 析 关 联 的 提升 度 、 置 信和 度 以 及 支持 
度 等 指标 找到 强 关 联 规 则 ， 为 用 户 提供 扩展 性 推荐 。 
2.4 优化 供需 链 结构 ， 控 制 经 营 风险 的 同时 降低 运营 成 本 

供需 链 优化 的 主要 作用 在 于 及 时 识别 经 营 风险 ， 降 
低 运 营 成 本 。 大 数据 对 供需 链 优化 的 两 个 作用 主要 通过 
两 端 即 上 游 供 应 端 和 下 游 需求 端的 历史 数据 分 析 研 究 ， 
在 发 现 与 创造 用 户 需求 的 前 提 下 判断 供应 端的 各 种 能 力 
与 风险 ， 提 高 经 营 水 平 。 

通过 大 数据 技术 优化 供需 链 ， 
应 从 两 方面 展开 : 

从 供应 端 角度 重点 加 强 能 力 分 析 ， 包括 供应 端的 生 


实现 经 营 效 率 的 提升 
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合法 性 ; 建立 对 UGC 内 容 生产 者 的 发 掘 与 培养 办 法 ， 逐 
步 往 PGC 方向 发 展 ， 提 升 其 内 容 生产 质量 ; 结合 人 工 审 
核 与 用 户 反 馈 , 建立 优质 内 容 的 筛选 评价 与 深加工 流程 。 

从 需求 端 角度 重点 在 于 通过 对 各 种 半 结 构 化 和 非 结 
构 化 数据 的 分 析 ， 主 要 是 基于 知识 元 分 析 的 内 容 、 内 容 
交互 过 程 中 的 输出 内 容 〈 例 如 书评 ) 以 及 各 种 自 媒 体内 
容 等 ， 发 现 空白 或 者 尚未 满足 市 场 的 内 容 需求 ， 通 过 与 
之 有 关 的 相关 关联 与 因果 关联 分 析 ， 确 定 所 需 基本 的 表 
达 思 想 ， 进 一 步 通过 用 户 画 像 所 呈现 的 应 用 场景 确定 内 
容 的 表达 方式 。 其 次 是 用 户 的 基本 特征 数据 、 消 费 记录 
数据 、 地 理 位 置 数据 、 线 上 互动 数据 、 线 下 行为 数据 、 
web 公共 数据 以 及 社交 生成 数据 等 ” 确定 内 容 生 产 元 素 
与 用 户 数据 之 间 的 关系 。 最 后 通过 与 供应 端 内 容 生 产 者 
的 匹配 ,确定 不 同 内 容 生 产 者 的 分 工 合作 , 满足 市 场 需求 。 
2.5 加 强 资源 深度 开发 ， 实 现 知识 服务 的 更 新 迭代 

大 数据 对 出 版 资源 的 深度 开发 在 自 有 资源 整合 的 基 
础 上 完成 知识 的 组 织 、 关 联 、 控 据 与 重 构 ， 完 成 知识 服 
务 基本 架构 的 搭建 ， 进 一 步 拓展 整合 外 部 资源 并 及 时 更 
新 ， 形 成 知识 服务 产品 的 更 新 迭代 ， 帮 助 用 户 不 断 实现 
知识 发 现 。 

通过 大 数据 整合 资源 ， 推 动 知识 服务 不 断 升级 ， 主 
要 通过 以 下 几 个 方面 展开 : 

首先 是 在 根据 上 述 目标 用 户 画 像 ， 确 定 知识 服务 产 
品 主题 的 前 提 下 ， 组 织 所 需 的 内 容 资源 ， 对 资源 进行 深 
加 工 ， 构建 包 括 知识 元 标 引 、 隐 性 知识 标 引 、 动 态 标 引 
以 及 社会 标 引 在 内 的 知识 标 引 体系 ， 据 此 建立 完整 的 知 
识 关联 。 

其 次 是 不 断 对 知识 服务 产品 运营 过 程 中 通过 知识 交 
互 产生 的 输出 内 容 进行 标 引 ， 与 已 有 知识 内 容 建 立 关 联 ; 
及 时 获取 社会 新 产生 的 知识 内 容 与 信息 资讯 ， 在 知识 标 引 
的 基础 上 将 其 纳入 知识 体系 。 在 形成 动态 知识 关联 的 同时 
不 断 扩展 知识 体系 的 边界 ， 实 现 知识 服务 的 更 新 迭代 。 

最 后 是 根据 用 户 的 行为 特征 与 知识 之 间 的 连接 关系 
建立 个 性 化 的 关联 关系 , 为 用 户 提供 个 性 化 的 知识 体系 ， 


产能 力 、 响 应 能 力 、 管 理 能 力 与 风险 防范 能 力 等 。 数 字 
出 版 的 供应 端 包括 内 容 供 应 者 、 技 术 供 应 者 以 及 载体 供 
应 者 ， 其 中 ， 内 容 供应 者 是 重点 ， 各 种 UGC、PGC 与 
OGC 都 可 以 归 入 此 类 。 首 先 通过 大 数据 采集 数字 出 版 单 
位 自身 的 业务 数据 、 用 户 体验 、 交 互 数 据 等 ， 分 析 并 确 
定 自 身 的 定位 、 核 心 功 能 ， 进 行动 态 修正 与 调整 。 在 此 
基础 上 ， 通 过 对 PGC 与 OGC 等 内 容 供应 者 的 分 析 考 察 ， 
建立 基于 知识 生产 的 分 享 与 协作 网 络 ， 确 定 系 统 化 的 内 
容 来 源 与 供应 节奏 ; 建立 UCC 内 容 生产 者 的 筛选 与 审核 
办 法 ， 并 对 内 容 建立 严格 的 审查 办 法 ， 确 保 输出 内 容 的 


实现 个 人 意义 上 的 知识 发 现 。 例 如 , 用 户 学 习 输 入 假说 ， 
动机 可 能 是 研究 第 二 外 语 教学 理论 ， 也 可 能 在 研究 知识 
服务 运营 ， 还 可 能 在 研究 写作 理论 。 因 此 ， 必 须 综合 考 
察 用 户 的 浏览 内 容 、 创 作 内 容 ( 包含 引文 ) 、 交 互 内 容 
以 及 其 他 行为 特征 ， 据 此 为 用 户 提供 或 二 语 教学 ， 或 知 
识 服务 运营 ， 或 写作 理论 研究 的 关联 内 容 ， 提 供 精准 的 
内 容 推荐 ， 有 效 促 进 用 户 的 知识 吸收 ， 推 动 知 识 输出 ， 
知识 的 分 享 与 协作 。 


证 将 
闯 党 
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广播 电视 以 及 互联 网 出 版 等 多 种 形态 ， 与 知识 服务 的 界 
限 日 趋 模糊 , 不 仅 强 调 内 容 的 系统 性 、 关 联 性 、 交 互 性 ， 
更 强调 表达 的 场景 化 、 内 容 的 个 性 化 和 推荐 的 精准 化 ， 
提高 思想 到 达 的 有 效 性 。 这 些 特征 的 产生 一 方面 是 大 数 
据 在 数字 出 版 领域 发 展 的 必然 结果 ; 男 一 方面 ,通过 大 
数据 技术 得 到 了 强化 。 

大 数据 通过 对 各 种 信息 数据 资源 的 整合 、 分析、 关联 、 
挖掘 与 重 构 对 用 户 画 像 、 长 尾 经 营 、 流 程 再 造 、 供 需 链 
优化 以 及 知识 服务 深化 等 方面 产生 了 深刻 影响 ， 形 成 真 
正 以 用 户 为 中 心 的 内 容 生 产 、 交 互 与 交付 格局 ， 从 根本 
上 站 覆 了 传统 出 版 的 运营 模式 。 在 这 种 背景 下 ， 数 字 出 
版 企业 必须 从 用 户 体 验 优化 、 内 容 的 发 掘 与 过 滤 、 产 品 
的 协同 运营 、 供 需 链 结构 的 优化 以 及 知识 服务 的 更 新 等 
方面 入 手 ， 推动 出 版 业 的 全 面 转 型 发 展 。 别 
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